StyleTTS 2
https://styletts2.github.io/
Project
https://arxiv.org/abs/2306.07691
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models
https://github.com/yl4579/StyleTTS2
yl4579/StyleTTS2
Demo
https://huggingface.co/spaces/styletts2/styletts2
style diffusion
と
large speech language models
(SLMs)による
敵対的学習
を活用し、人間レベルのTTS合成を実現するtext-to-speech(
TTS
)モデルであるStyleTTS 2を紹介する
large speech language modelsは、敵対的学習において識別器として用いられ、音声言語モデルの知識を音声生成タスクに転移することで、音声の自然さを向上させる。
StyleTTS